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摘 要 : 随 着 科技 的 不 断 进步 ， 人 与 人 之 间 的 交流 更 加 快捷 方便 。 然 后 ， 由 于 作息 时 间 交 又 ， 受 交流 方式 影响 ， 作 者 与 编辑 、 
编 务 之 间 的 沟通 交流 矛盾 上 日益 凸显 ， 甚 至 成 为 限制 期 刊 进一步 发 展 的 短 板 。 在 媒体 融合 发 展 背景 下 ， 如 何 引 入 人 工 智能 ， 在 第 
一 时 间 解 决 作者 的 燃眉之急 ， 又 能 保证 编辑 日 常 工作 顺利 进行 ， 是 值得 研究 的 具体 问题 。 本 研究 采用 人 工 智 能 领域 中 重要 的 分 
支 一 一 自然 语言 处 理 相 关 技 术 ， 搭 建 了 基于 语义 分 类 、 相 似 度 识 别 的 新 媒体 智能 编 作 交互 系统 。 该 系统 可 作为 传统 期 刊 投 审 稿 
系统 与 微 信 公众 号 的 桥梁 ， 不 仅 能 实现 智能 问答 、 查 稿 等 功能 ， 及 时 解决 作者 常规 问题 和 需求 ， 解 放 编 辑 和 编 务 的 生产 力 ， 开 
展 其 他 创新 性 期 刊 服务 工作 ， 同 时 盘活 数据 库 中 的 作者 、 专 家 资源 ， 引 导 其 向 期 刊 新 媒体 汇聚 ， 为 期 刊 融 媒体 发 展商 定 基 础 。 


全 关键 词 ， 人 工 智能 ， 自 然 语言 处 理 ， 新 媒体 ;科技 期 和 中 图 分 类 号 : G124 。 ”文献 标识 码 : A 

| 文章 编号 : 1671-0134 ( 2021 ) 12-14603 DOI: 10.19483/j.cnki.11—4653/n.2021.12.047 

本 文 著录 格式 : 张 欧 捷 ， 王 东 ， 丰 瑞 兵 ， 陈 健 ， 毕 丽 . 基于 自然 语言 处 理 的 期 刊 新 媒体 智能 编 作 交互 系统 研发 与 应 用 思 . 中 
3 国 传媒 科技 ，2021 ( 12) : 146 一 148. 

©O 

S 2015 年 ， 国 家 新 闻 出 版 署 颁布 的 《关于 推动 传统 媒 ” 中 ， 利 用 人 工 管 能 进行 学 术 出 版 流程 再 造 ， 能 实现 传统 
体 和 新 兴 媒 体 融 合 发 展 的 指导 意见 》 就 如 何 推动 传统 媒体 ”出 版 产品 和 数字 产品 一 体 化 、 协 同化 、 同 步 化 ， 知 识 服 
CD 和 新 兴 媒 体 融合 发 展 提出 指导 意见 。2020 年 中 共 中 央 办 ， 务 智 能 化 等 愿景 。84 人 工 智能 更 多 地 会 针对 传统 编辑 行 
CN 公 打 、 国 务 院 办 公 厅 印发 了 《关于 加 快 推进 媒体 深度 融合 业 当 中 的 简单 性 工作 及 重复 性 工作 , 构建 智慧 出 版 模式 。 
总 的 发 展 意见 》， 为 学 术 期 刊 的 媒体 融合 发 展 确定 了 重点 ， ”59 例如， 中 国 大 百科 全 书 出 版 社 与 中 科 院 合作 研发 人 工 
村 吹 响 了 融合 改革 的 “号 角 ”。2020 年 12 月 ， 中 国 科学 技 ”智能 产品 “ 司 南 君 ”， 能 实现 人 机 互 答 ， 丰 富 了 出 版 业 
.之 术 信 息 研究 所 发 布 《2020 年 中 国 科技 论文 统计 结果 》， ” 态 "有 医院 针对 医学 检验 仪器 新 人 职 维修 人 员 因 经 验 
>< 结果 显示 ，2010 年 至 2020 年 10 月 ， 中 国 科技 人 员 发 表 ”不 足 , 设计 了 人 工 智能 医学 检验 仪器 故障 智能 问 诊 系统 ， 
© 国际 论文 301.91 万 篇 ， 比 2019 年 的 统计 结果 同期 提高 了 ”能 为 维修 人 员 提 供 可 靠 的 维修 建议 。 

庄 15.8%; 论文 被 引用 3605.71 万 次 ， 比 2019 年 的 统计 结 这 些 实践 探索 为 传统 期 刊 与 新 媒体 的 进一步 融合 提 
提高 了 26.7%。 在 科技 论文 产 出 不 断 提高 的 背景 下 ,科技 供 了 思路 与 参考 ,但 由 上 述 分 析 可 知 ， 国 内 已 有 研究 很 
© 期 刊 的 数字 化 转型 与 融合 发 展 迎 来 新 的 机 遇 与 挑战 。 一方 ” 少 有 期 刊 与 新 媒体 具体 融合 案例 和 经 验 。 本 研究 针对 编 


面 , 以 人 工 智 能 、 新 媒体 为 代表 的 新 技术 、 新 事物 的 引入 ， ” 辑 / 编 务 和 作者 交互 (后 简称 编 作 交互 ) 这 个 具体 应 用 
为 出 版 领域 注入 活力 ,未 来 发 展 潜力 让 人 充满 遐想 ; 另 一 场景 进行 探索 和 尝试 , 通过 引入 人 工 智 能 分 支 技术 之 一 
方面 ， 究 竞 在 哪个 地 方 引 入 与 融合 ， 具 体 效果 如 何 ， 存 在 自然 语言 处 理 的 相关 技术 ， 搭 建 连接 投 审 稿 系统 与 
哪些 问题 ， 可 以 向 哪些 方向 继续 改进 和 延伸 等 问题 缺乏 具 ” 微 信 公 众 号 的 智能 交互 系统 , 以 提高 科技 期 刊 运营 效率 。 


体 案 例 经 验 ， 为 科技 期 刊 发 展 的 布局 和 策略 带 来 挑战 。 因 
此 ， 以 具体 应 用 场景 为 切入 点 ,将 人 工 智能 引入 科技 期 刊 
的 新 媒体 融合 发 展 并 研究 其 相关 应 用 经 验 具 有 重要 意义 。 
1. 已 有 研究 分 析 

随 着 人 工 智能 技术 的 不 断 发 展 ， 众 多 学 者 在 人 工 智 
能 与 期 刊 、 融 媒体 发 展 方面 开展 了 研究 。 学 者 们 提出 ， 
以 用 户 为 核心 要 素 ， 采 用 人 工 智能 算法 对 读者 进行 准确 
定位 ， 能 满足 读者 个 性 化 需求 。" ”出 版 企业 数字 化 转型 


这 是 传统 媒体 与 人 工 智能 技术 相 融 合 的 交叉 性 研究 ， 也 
是 学 术 期 刊 在 新 媒体 领域 的 开创 性 探索 研究 。 
2. 智能 编 作 交互 的 需求 
2.1 传统 编 作 交互 的 矛盾 

编 作 交互 却 逐 渐 成 为 限制 期 刊 进一步 发 展 的 短 板 。 
一 方面 ， 当 前 编 作 交互 主要 为 电话 、 投 稿 系 统 站 内 信息 
等 传统 交互 方式 ， 作 者 通常 只 能 在 工作 时 间 拨 打 电 话 ， 
且 有 时 会 出 现 占线 、 编 辑 / 编 务 临 时 有 事 而 无 法 接 通 咨询 
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的 情况 , 编辑/ 编 务 很 难 在 第 一 时 间 解 决 作者 的 燃眉之急 ; 
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智能 编 作 交互 系统 类 似 一 座 桥梁 ， 沟 通 微 信 公众 号 


而 作者 通过 投稿 系统 发 送 站 内 信息 ， 存 在 较 严 重 的 信息 
滞后 性 ， 交 互 效率 低下 ， 且 需要 作者 通过 PC 电脑 发 送 站 
内 信息 ， 操 作 复 杂 。 另 一 方面 ， 以 重庆 市 卫生 健康 统计 
信息 中 心 下 属 期 刊 《现代 医药 卫生 》 为 例 ， 作 者 大 多 数 
咨询 内 容 为 期 刊 情况 、 投 审 稿 流程 等 投稿 前 常规 问题 ， 
或 者 是 稿件 刊登 、 发 票 和 快递 情况 等 投稿 后 相关 问题 ， 
前 者 内 容重 复 率 高 , 后 者 需要 编辑 / 编 务 查询 系统 后 回复 ， 
耗费 时 间 长 ， 加 之 来 电 数量 大 ， 导 致 相关 编辑 / 编 务 除 接 
电话 和 回复 站 内 信息 外 ， 很 难 开展 其 他 创新 性 工作 ， 工 
作 时 间 被 严重 挤 压 ， 人 力 资 源 浪 费 情 况 严 重 。 然 而 ， 编 
FE 交互 又 是 期 刊 出 版 过 程 中 的 重要 环节 ， 在 期 刊 守 正 创 
新 、 提 升 作 者 服务 质量 和 期 刊 声誉 方面 的 作用 不 可 忽视 ， 
需要 期 刊 花 大 力气 做 好 该 项 工作 。 随 着 未 来 期 刊 的 投稿 
量 不 断 上 升 ， 期 刊 融合 化 、 数 字 化 转型 的 进一步 深入 ， 
编 作 交互 矛盾 对 期 刊 的 影响 正 不 断 放大 。 
2.2 “沉睡 ”的 投 审 稿 系统 数据 库 资 源 

乘 着 移动 互联 网 络 、 智 能 终端 及 软 硬 件 技术 莲 勃 发 展 
的 东风 ， 新 媒体 应 声 而 起 。 众 多 期 刊 媒体 也 开始 以 新 媒体 
为 基础 进行 融 媒 体 探索 ， 尝 试 建立 和 运营 微 信 公众 号 , 但 
都 遇 到 类 似 的 问题 : 缺乏 流量 和 用 户 基础 。 根 据 西 瓜 数据 
发 布 的 《2020 年 公众 号 生态 趋势 调查 报告 》， 微 信 公 众 号 
创作 者 数量 已 超 2000 万 ， 全 网 流量 竞争 日 趋 激烈 。 对 于 
科技 期 刊 的 微 信 公 众 号 而 言 ， 即 便 是 花 钱 引流 也 很 难 获得 
目标 用 户 ， 长 此 以 往 将 逐步 失去 活力 甚至 被 边缘 化 。 另 一 
方面 ， 科 技 期 刊 的 投 审 稿 系统 数据 库 中 “沉睡 ”着 众多 宝 
贵 的 数据 资源 一 一 忠实 于 期 刊 的 作者 、 专 家 数据 。 如 果 能 
通过 有 效 手 段 复 用 这 些 资源 ， 逐 步 通 过 实用 功能 和 方法 将 
作者 、 专 家 引 向 微 信 公 众 号 ， 将 使 后 者 获得 长 足 发 展 ， 为 
期 刊 的 数字 化 、 融 媒体 转型 打下 基础 。 叫 
2.3 编 作 交互 的 需求 

人 工 智能 的 加 入 ， 推 动 了 编 作 交互 流程 的 改进 ， 使 
其 最 大 限度 地 满足 作者 、 专 家 和 编辑 三 方 需求 。 
辑 在 岗 在 位 的 时 候 ， 作 者 、 专 家 仍然 可 以 通过 电话 
等 常规 方式 联系 编辑 同步 处 理 较为 紧急 的 琼 手 问题 ， 另 外 ， 
可 以 通过 人 工 智 能 的 系统 回答 重复 性 的 咨询 内 容 ， 满 足 作 者 
个 性 化 查询 ， 尽 可 能 地 随时 解决 作者 的 困惑 与 需求 。 在 此 基 
础 上 ， 向 数据 库 中 的 作者 、 专 家 进行 提示 与 引流 ， 逐 步 向 微 
言 公众 号 迁移 作者 、 专 家 资源 。 加 上 期 刊 自身 在 微 信 公众 号 
上 的 内 容 开 发 ， 最 终 实 现 微 信 公众 号 的 跨越 式 进步 。 
3. 智能 编 作 交互 系统 研发 与 应 用 

参考 上 述 的 编 作 交互 需求 ， 本 研究 将 研发 和 应 用 分 
为 交互 功能 研发 、 系 统 与 数据 库 通 信 连 接 、 系 统 与 微 信 
公众 号 通信 连接 、 整 合 完善 等 四 个 部 分 。 
3.1 智能 编 作 交互 系统 的 基本 架构 
1 于 较 多 期 刊 的 投 审 稿 系统 是 在 2010 年 前 后 建立 ， 彼 
时 社交 网 络 刚刚 萌芽 ， 微 信也 没有 公众 号 一 说 ， 故 投 审 稿 系 
统 大 多 为 独立 封闭 系统 ， 并 没有 延伸 功能 或 相关 接口 。 在 此 
情况 下 ， 本 研究 考虑 研发 独立 运行 的 系统 ， 既 连接 微 信 公众 
号 ， 又 不 会 对 原 有 的 投 审 稿 系统 和 工作 流程 产生 影响 。 
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与 投 审 稿 系统 数据 库 。 首 先 ， 系 统 在 微 信 公 众 号 部 分 获 
取 来 自用 户 的 文字 咨询 ， 将 其 传人 意图 识别 模块 进行 识 
别 。 如 果 判 定 为 常规 问答 ， 则 通过 相似 文本 拟 合 找寻 最 
接近 的 问题 并 返回 答案 ;如 果 判 定 为 查询 ， 则 将 文字 转 
化 为 SQL 数据 库 查 询 指令 ， 通 过 投 审 稿 系统 数据 库 获 取 
稿件 的 审 稿 情况 , 并 根据 稿件 状态 给 予 作者 对 应 的 建议 。 
最 终 ， 系 统 再 将 结果 以 文字 回复 用 户 ， 实 现 随时 随地 的 
交互 流程 (如 图 1) 。 


< 意图 识别 > 
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咨询 


信人 八 品 祝 信 公众 与 通信 | 
必 ) 公众 号 一 gumcom 框 采 相似 文本 拟 合 


图 1 智能 编 作 交互 系统 运行 流程 


3.2 核心 功能 研发 
智能 编 作 交互 系统 的 核心 功能 包括 3 个 部 分 : 意图 
识别 、 相 似 文本 拟 合 与 数据 库 查 询 。 
3.2.1 基础 准备 

作为 人 工 智 能 的 重要 分 支 ， 自 然 语言 处 理 主要 实现 
人 与 计算 机 之 间 利 用 自然 语言 进行 有 效 通信 的 各 种 方法 。 
其 中 ， 如 何 用 数学 语言 来 表示 文本 ， 继 而 将 其 转化 为 实 
现 某 项 功能 的 模型 ， 是 建立 系统 的 基础 。 本 研究 以 词 向 
量 Word2vec 将 单个 文字 转化 为 可 供 计 算数 字 单 位 ， 并 利 
用 Fasttext 思路 中， 将 句 中 各 单字 向 量 相 加 后 求 平均 值 ， 
得 到 该 句 话 的 平均 向 量 。 两 者 的 精度 高 、 优 化 效率 高 ， 
能 有 效 提高 分 类 准确 率 和 相似 文本 匹配 率 。 

编程 方面 采用 Python 语言 编程 ， 主 要 用 Jupyter 
Notebook 进行 实时 编码 与 调试 。 以 重庆 市 卫生 健康 统计 信 
息 中 心 下 属 期 刊 《现代 医药 卫生 》 投 审 稿 系统 数据 库 2020 
年 及 以 前 的 50000 余 条 投 审 稿 数据 (包括 稿件 状态 、 作 者 
言 息 、 所 属 编辑 等 ) 作 为 查询 基础 , 待 后 期 进行 数据 的 应 用 。 
3.2.2 意图 识别 

意图 识别 是 对 输入 的 问 询 内 容 进行 分 类 处 理 。 其 会 
调用 已 保存 好 的 文字 表征 和 矩阵 和 支持 向 量 机 (SVM ) 分 类 
模型 ， 将 作者 经 微 信 公 众 号 的 问 询 内 容 转 为 平均 向 量 ， 输 
入 SVM 分 类 模型 进行 预测 ， 获 得 意图 识别 结果 。 结 果 分 
为 3 种 : “咨询 ”， 转 入 智能 问答 流程 ，“ 查 稿 ”， 转 人 
数据 库 查询 流程 ; “聊天 ”, 则 提示 “AI 暂时 不 会 悠 大山 ”。 
3.2.3 智能 问答 
智能 问答 流程 采用 相似 文本 拟 合 ， 其 基础 原理 是 计 
算 两 个 句子 向 量 夹 角 的 余 弱 值 (余弦 相似 度 ) ， 用 于 衡 
量 两 个 句子 之 间 的 相似 性 。 当 系统 将 问 询 内 容 转 为 平均 
向 量 后 ， 利 用 Sklearn 工具 库 的 Cosine_similarity 函数 ， 对 
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比 问 询 内 容 和 备 选 问 题 的 余弦 相似 度 ， 选 取 与 问 询 内 容 
最 接近 的 备 选 问题 , 然后 将 对 应 问题 的 回复 返回 给 作者 。 
3.2.4 数据 库 查 询 

转 和 人 数据 库 查 询 流程 后 , 系统 会 扫描 整个 问 询 句子 ， 
利用 正则 表达 式 获取 稿 号 (《 现 代 医 药 卫 生 》 是 以 “S” +10 
位 数字 组 成 ) 或 作者 名 ， 然 后 引入 Pymssql 工具 库 ， 于 
Python 程序 端 执行 Sql 语句, 在 数据 库 中 进行 查询 和 匹配 ， 


可 供 作 者 了 解 该 领域 相关 知识 点 、 研 究 进展 的 人 工 智 能 
产品 ， 实 现 人 机 互 答 聊天 。 
4. 小 结 与 展望 

通过 对 自然 语言 处 理 技术 的 实际 探索 应 用 发 现 ， 系 
统 可 以 通过 已 有 的 文字 、 数 据 进 行 学 习 、 归 纳 ， 完 成 需 
求 内 容 的 预测 '"'， 搭 建 与 传统 投 审 稿 系统 的 通信 桥梁 ， 
盘活 数据 库 中 的 数据 资源 。 可 以 预见 的 是 ， 以 此 为 基础 ， 


成 功 后 提取 数据 库 中 稿件 的 相关 信息 。 组 合 定式 文 ， 回 
复 作者 稿件 所 处 状态 ， 以 及 下 一 步 将 要 开展 的 工作 。 
3.3 与 微 信 公 众 号 通信 连接 

无 论 是 订阅 号 还 是 服务 号 ， 是 回复 信息 交流 还 是 发 
布 推 文 ， 独立 于 微 信 公 众 号 原 网 页 进行 的 操作 都 需要 进 


继续 对 智能 编 作 交互 系统 的 相关 功能 进行 扩充 和 延伸 ， 
可 能 实现 基于 微 信 端 的 审 稿 、 定 向 ( 对 某 位 编辑 ) 咨询 、 
投 审 稿 全 流程 提醒 与 服务 支持 等 功能 。 如 果 将 智能 编 作 
交互 系统 作为 单一 功能 模块 纳入 期 刊 数字 化 融 媒 体 平台 ， 
并 同步 加 入 会 议 服 务 ""、 知 识 服 务 ""、 在 线 培训 等 功能 


行 微 信 公众 号 开发 。 其 中 ， 主 要 是 移动 端 网 页 的 页 面 开 
发 , 与 微 信 公 众 号 通信 的 关键 则 是 搭建 合理 的 开发 框架 ， 
完成 微 信 公 众 号 与 智能 编 作 交互 系统 的 通信 。 

由 于 服务 器 为 Cent0S7, 且 考 虑 要 整体 服务 需要 简单 、 
快速 ， 本 研究 采用 了 Gunicorn Python WSGCLI HTTP Server 
作为 微 信 公众 号 开发 框架 ; 引入 Werobot 工具 库 ， 解 析 
微 信 服务 器 发 来 的 信息 数据 ， 从 中 提取 作者 发 送 的 消息 
内 容 进 行 计 算 ， 并 将 回复 内 容 打包 成 可 识别 的 信息 数据 
传 回 微 信服 务 器 。 

3.4 系统 的 整合 完善 
智能 编 作 交互 系统 包含 两 个 部 分 ， 训 练 部 分 与 应 用 
部 分 。 两 个 部 分 可 以 同步 进行 ， 异步 迭代 升级 。 

在 训练 部 分 ， 首 先 纳 入 所 有 训练 数据 集 文本 ， 去 掉 
里 面 的 停止 词 (Stop words， 表 示 实 际 语 言 意义 的 字 词 ) 
后 ， 拆 分 为 单个 文字 ， 纳 入 Gensim 工具 库 进 行 训 练 ， 获 
得 Word2vec 的 文字 表征 和 矩阵， 输入 拆 分 好 的 数据 集 文本 
句子 ， 转 化 为 向 量 后 ， 利 用 Fasttext 计算 该 句 话 的 平均 向 
量 。 将 所 有 训练 数据 集 文本 的 平均 向 量 值 输入 Sklearn 工 
具 库 ， 训 练 支持 向 量 机 (SVM ) 分 类 模型 ( 技术 成 熟 ， 
训练 速度 快 ， 精 度 高 ) 。 最 后 ， 将 文字 表征 矩阵 和 SVM 
分 类 模型 保存 ， 待 意图 识别 的 应 用 部 分 调用 。 

应 用 程序 启动 以 后 会 永 续 运 行 ， 检 测 用 户 发 给 微 信 
公众 号 的 内 容 ， 及 时 进行 计算 与 回复 。 由 于 将 训练 与 应 
用 分 开 ， 即 使 有 文字 内 容 更 新 要 进行 训练 或 者 训练 模块 
出 现 问题 ， 也 不 会 对 正在 进行 的 应 用 程序 造成 影响 ， 后 
者 会 继续 采用 已 有 的 模型 进行 计算 和 回复 。 完成 训练 后 ， 
重启 应 用 程序 即 可 实现 内 容 的 迭代 升级 。 

3.5 有 待 解决 的 问题 

在 测试 用 个 人 公众 号 (公众 号 名 为 “村 长 NLP 自 留 
地 ”) 投入 使 用 后 ， 智 能 编 作 交互 系统 已 经 能 识别 问题 
并 进行 针对 性 回答 。 在 研发 过 程 中 ， 本 研究 仍 也 有 一 些 
问题 尚 竺 解决 和 完善 。 本 研究 中 导入 的 文本 数量 有 限 ， 

盖 问 题 的 方向 和 范围 不 足 ， 采 用 模型 和 算法 以 效率 为 
优先 目标 ， 有 时 候 容 易 出 现 “ 答 非 所 问 ” 的 现象 ， 有 待 
进一步 扩充 文本 内 容 ， 优 化 算法 与 模型 ， 同时 建立 行 之 
有 效 的 罕见 问题 收集 、 整 理 机 制 ， 最 终 提 高 作者 咨询 的 
满意 度 。 此 外 ， 受 限于 泛 化 能 力 优 先 ， 目 前 “聊天 ” 功 
能 尚未 开放 ， 未 来 可 针对 期 刊 所 面向 的 专门 领域 ， 研 发 


模块 , 并 深度 与 投 审 稿 系统 进行 对 接 开 发 , 实现 功能 协同 ， 
其 成 品 或 将 成 为 期 刊 数 字 化 转型 和 融 媒体 发 展 的 重要 思 
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